Fundamental limitations of genomic language models for realistic sequence generation
本研究は、Evo 2 や megaDNA などのゲノム言語モデルが局所的な配列統計は捉えられるものの、長距離のゲノム構造や反復配列、進化的制約などの生物学的特徴を再現できず、合成ゲノムと天然ゲノムを高い精度で識別可能であることを示し、現在のアーキテクチャには現実的な配列生成における根本的な限界があることを明らかにした。
49 件の論文
合成生物学は、生命の設計図をまるでプログラミングのように書き換え、新しい機能を持つ生物システムを作り出す最先端の分野です。従来の生物学が自然の仕組みを理解することに重きを置くのに対し、ここでは人工的な部品を組み合わせて、医療や環境問題の解決に役立つ新たなソリューションを構築します。
Gist.Science では、この分野の最新動向を bioRxiv から毎日収集し、すべてを網羅的に取り上げています。各プレプリント論文について、専門知識がなくても理解できる平易な要約と、研究者向けの詳細な技術的解説の両方を提供し、複雑な研究成果を誰でもアクセスしやすく変えることを目指しています。
以下に、bioRxiv から新たに追加された合成生物学の最新論文リストを示します。
本研究は、Evo 2 や megaDNA などのゲノム言語モデルが局所的な配列統計は捉えられるものの、長距離のゲノム構造や反復配列、進化的制約などの生物学的特徴を再現できず、合成ゲノムと天然ゲノムを高い精度で識別可能であることを示し、現在のアーキテクチャには現実的な配列生成における根本的な限界があることを明らかにした。
大規模な遺伝子合成と DNA シャッフルによって蛍光タンパク質の配列多様性を実験的に拡大し、そのデータで機械学習モデルを微調整することで、自然に存在しない領域にも機能する新規蛍光タンパク質の設計を可能にした。
合成核酸の注文者検証において、AI(特に Gemini 2.5 Pro)は人間と同等の精度を維持しつつ、情報収集タスクではコストを約 50 分の 1 に削減できることが示され、AI による情報収集と人間による最終判断の組み合わせが実用化の有力な手段であることが結論付けられました。
この論文は、大腸菌を用いた人工バイオセンサーを開発・活用することで、従来の測定法では捉えきれない炎症性マウス腸管内における宿主由来のシアル酸の空間的な利用可能性の動態を解明し、その治療応用可能性を示したものである。
本研究は、合成細胞内のタンパク質系(DNA 自己複製系やリン脂質合成経路など)の機能向上を目指し、複数の遺伝子を同時に標的としたコンビナトリアル DNA ライブラリを人工細胞(合成ベシクル)内でスクリーニングし、最適な翻訳制御パラメータや遺伝子変異を同定するとともに、単一変異データに基づく予測モデルの妥当性を検証したものである。
本研究は、大腸菌のオルソゴナル複製システム「EcORep」を大幅に改良し、さらに最も増殖速度の速い細菌「Vibrio natriegens」に移植した「VinORep」を開発することで、遺伝子進化の速度を生物学的限界に近づけ、16 時間という極めて短時間で多変異を蓄積させる新たな機能進化を可能にしたことを報告しています。
本論文は、シアンバクテリアの遺伝子操作を目的とした CyanoGate モジュラークローニングキットを拡張し、最大 6 つの遺伝子からなる合成オペロンの構築、発現、および染色体への統合を可能にする「CyanOperon」システムを開発し、その有用性を大腸菌およびシアノバクテリアにおける violacein 生合成経路の構築や RBS ライブラリ解析などを通じて実証したものである。
この論文は、合成 RNA-タンパク質(sRNP)を基盤とした高親和性のシアル酸含有ナノ粒子(シオログラン)を開発し、これらがインフルエンザウイルスの細胞内侵入を阻害するだけでなく、シアル酸結合レクチンとの相互作用によって凝集状態が変化する特性を利用した糖鎖密度の定量評価法を確立したことを報告しています。
この論文は、マイクロドロplet内での単一コピーDNAテンプレートからのタンパク質発現を約10倍増幅させるために、T7 RNAポリメラーゼの添加とリボソーム濃度の低下という最適化手法を開発し、DNAが極めて少ない環境での機能スクリーニングや合成細胞の構築を可能にしたことを報告しています。